智能论文笔记

A Random Forest and Current Fault Texture Feature-Based Method for Current Sensor Fault Diagnosis in Three-Phase PWM VSR

Lei Kou , Xiao-dong Gong , Yi Zheng , Xiu-hui Ni , Yang Li , Quan-de Yuan , Ya-nan Dong

分类：人工智能

2022-11-08

Three-phase PWM voltage-source rectifier (VSR) systems have been widely used in various energy conversion systems, where current sensors are the key component for state monitoring and system control. The current sensor faults may bring hidden danger or damage to the whole system; therefore, this paper proposed a random forest (RF) and current fault texture feature-based method for current sensor fault diagnosis in three-phase PWM VSR systems. First, the three-phase alternating currents (ACs) of the three-phase PWM VSR are collected to extract the current fault texture features, and no additional hardware sensors are needed to avoid causing additional unstable factors. Then, the current fault texture features are adopted to train the random forest current sensor fault detection and diagnosis (CSFDD) classifier, which is a data-driven CSFDD classifier. Finally, the effectiveness of the proposed method is verified by simulation experiments. The result shows that the current sensor faults can be detected and located successfully and that it can effectively provide fault locations for maintenance personnel to keep the stable operation of the whole system.

translated by 谷歌翻译

Prediction of superconducting properties of materials based on machine learning models

Jie Hu , Yongquan Jiang , Yang Yan , Houchen Zuo

分类：机器学习

2022-11-06

The application of superconducting materials is becoming more and more widespread. Traditionally, the discovery of new superconducting materials relies on the experience of experts and a large number of "trial and error" experiments, which not only increases the cost of experiments but also prolongs the period of discovering new superconducting materials. In recent years, machine learning has been increasingly applied to materials science. Based on this, this manuscript proposes the use of XGBoost model to identify superconductors; the first application of deep forest model to predict the critical temperature of superconductors; the first application of deep forest to predict the band gap of materials; and application of a new sub-network model to predict the Fermi energy level of materials. Compared with our known similar literature, all the above algorithms reach state-of-the-art. Finally, this manuscript uses the above models to search the COD public dataset and identify 50 candidate superconducting materials with possible critical temperature greater than 90 K.

translated by 谷歌翻译

Taking a Respite from Representation Learning for Molecular Property Prediction

Jianyuan Deng , Zhibo Yang , Hehe Wang , Iwao Ojima , Dimitris Samaras , Fusheng Wang

分类：人工智能 | 机器学习

2022-09-26

人工智能（AI）已被广泛应用于药物发现中，其主要任务是分子财产预测。尽管分子表示学习中AI技术的繁荣，但尚未仔细检查分子性质预测的一些关键方面。在这项研究中，我们对三个代表性模型，即随机森林，莫尔伯特和格罗弗进行了系统比较，该模型分别利用了三个主要的分子表示，扩展连接的指纹，微笑的字符串和分子图。值得注意的是，莫尔伯特（Molbert）和格罗弗（Grover）以自我监督的方式在大规模的无标记分子库中进行了预定。除了常用的分子基准数据集外，我们还组装了一套与阿片类药物相关的数据集进行下游预测评估。我们首先对标签分布和结构分析进行了数据集分析；我们还检查了阿片类药物相关数据集中的活动悬崖问题。然后，我们培训了4,320个预测模型，并评估了学习表示的有用性。此外，我们通过研究统计测试，评估指标和任务设置的效果来探索模型评估。最后，我们将化学空间的概括分解为施加间和支柱内的概括，并测量了预测性能，以评估两种设置下模型的普遍性。通过采取这种喘息，我们反映了分子财产预测的基本关键方面，希望在该领域带来更好的AI技术的意识。

translated by 谷歌翻译

Time-to-Green predictions for fully-actuated signal control systems with supervised learning

Alexander Genser , Michail A. Makridis , Kaidi Yang , Lukas Ambühl , Monica Menendez , Anastasios Kouvelas

分类：机器学习

2022-08-24

最近，已经努力将信号阶段和时机（SPAT）消息标准化。这些消息包含所有信号交叉方法的信号相时机。因此，这些信息可用于有效的运动计划，从而导致更多均匀的交通流量和均匀的速度轮廓。尽管努力为半活化的信号控制系统提供了可靠的预测，但预测完全驱动控制的信号相时仍具有挑战性。本文提出了使用聚合的流量信号和循环检测器数据的时间序列预测框架。我们利用最先进的机器学习模型来预测未来信号阶段的持续时间。线性回归（LR），随机森林（RF）和长期内存（LSTM）神经网络的性能是针对天真基线模型进行评估的。结果基于瑞士苏黎世的全面信号控制系统的经验数据集表明，机器学习模型的表现优于常规预测方法。此外，基于树木的决策模型（例如RF）的表现最佳，其准确性满足实用应用要求。

translated by 谷歌翻译

HTML版本

Machine learning meets false discovery rate

Ariane Marandon , Lihua Lei , David Mary , Etienne Roquain

分类： (统计)机器学习

2022-08-13

经典的错误发现率（FDR）控制程序提供了强大而可解释的保证，而它们通常缺乏灵活性。另一方面，最近的机器学习分类算法是基于随机森林（RF）或神经网络（NN）的算法，具有出色的实践表现，但缺乏解释和理论保证。在本文中，我们通过引入新的自适应新颖性检测程序（称为Adadetect）来使这两个相遇。它将多个测试文献的最新作品范围扩展到高维度的范围，尤其是Yang等人的范围。（2021）。显示ADADETECT既可以强烈控制FDR，又具有在特定意义上模仿甲骨文之一的力量。理论结果，几个基准数据集上的数值实验以及对天体物理数据的应用，我们的方法的兴趣和有效性得到了证明。特别是，虽然可以将AdadEtect与任何分类器结合使用，但它在带有RF的现实世界数据集以及带有NN的图像上特别有效。

translated by 谷歌翻译

GCF: Generalized Causal Forest for Heterogeneous Treatment Effect Estimation in Online Marketplace

Shu Wan , Chen Zheng , Zhonggen Sun , Mengfan Xu , Xiaoqing Yang , Hongtu Zhu , Jiecheng Guo

分类： (统计)机器学习 | 机器学习

2022-03-21

Uplift建模是一种快速增长的方法，它利用因果推理和机器学习方法直接估计异质治疗效果，该效果已广泛应用于各种在线市场，以帮助近年来大规模决策。现有的流行模型，例如因果森林（CF），仅限于离散治疗或对可能遭受模型错误指定的结果处理关系的参数假设。但是，在市场上经常出现连续的治疗（例如，价格，持续时间）。为了减轻这些限制，我们使用基于内核的双重稳健估计器来恢复非参数剂量反应函数，可以灵活地对连续治疗效果进行模拟。此外，我们提出了一个基于距离的分裂标准，以捕获连续处理的异质性。我们称提出的算法广义因果林（GCF）将CF的用例推广到更广泛的环境。我们通过得出估算器的渐近性能，并将其与合成和现实世界数据集的流行隆升建模方法进行比较，从而显示了GCF的有效性。我们在Spark上实施GCF，并成功将其部署到领先的乘车共享公司的大规模在线定价系统中。在线A/B测试结果进一步验证了GCF的优势。

translated by 谷歌翻译

Efficient Registration of Forest Point Clouds by Global Matching of Relative Stem Positions

Xufei Wang , Zexin Yang , Xiaojun Cheng , Jantien Stoter , Wenbin Xu , Zhenlun Wu , Liangliang Nan

分类：计算机视觉

2021-12-21

注册森林环境的点云是精密林业局部激光雷达应用的必要先决条件。最先进的森林点云登记方法需要提取单个树属性，并且在处理具有致密树的真实森林点云时，它们具有效率的瓶颈。我们提出了一种自动，坚固，高效的方法，用于登记森林点云。我们的方法首先定位树从原料点云茎，然后根据他们的相对空间关系确定准变换茎匹配。相较于现有的方法，我们的算法不需要额外的单株属性，具有线性复杂的环境中的树木数量，允许它的大森林环境对齐点云。广泛的实验表明，我们的方法优于关于登记精度和稳健性的最先进的方法，并且在效率方面显着优于现有技术。此外，我们引入一个新的基准数据集，补充的开发和注册方法评价森林点云的极少数现有的开放的数据集。

translated by 谷歌翻译

Data-Driven Reachability analysis and Support set Estimation with Christoffel Functions

Alex Devonport , Forest Yang , Laurent El Ghaoui , Murat Arcak

分类：机器学习

2021-12-18

我们使用仅使用独立和相同分布的样本的有限集合来估计用于估计动态系统的正向可迁移装置的算法。产生的估计是称为经验逆克里斯科特的函数的诸如函数的Sublevel组：已知经验逆Christoffel功能，以提供对概率分布的支持的良好近似。除了可达性分析之外，可以应用于估计随机变量支持的一般问题，这在数据科学中具有数据科学中的应用程序，可以应用于数据集中的Novelties和异常值。在安全是一个问题的应用中，保证在有限数据集上保持的准确性至关重要。在本文中，我们在可能大致正确（PAC）框架下证明了我们算法的界限。除了应用古典VAPnik-Chervonenkis（VC）维度绑定参数之外，我们除了利用核化经验逆克里斯科特函数和高斯进程回归模型之间的正式连接，我们还应用PAC-Bayes定理。基于Pac-Bayes的界限适用于比VC维度参数更一般的Christoffel功能，并在实验中实现了更大的样本效率。

translated by 谷歌翻译

Automatic Analysis of Linguistic Features in Journal Articles of Different Academic Impacts with Feature Engineering Techniques

Siyu Lei , Ruiying Yang , Chu-Ren Huang

分类：自然语言处理

2021-11-15

英语研究文章（RAS）是学术界的重要类型，因此在过去的二十年中，雇用NLP的企图雇用NLP的发展得到了相当大的关注。然而，没有研究采用特征工程技术来研究不同学术影响的RA的语言特征（即，在高/中等冲击因子期刊上发表的高/中等引用时间的论文）。本研究试图利用特征工程方法提取高和中度冲击轴颈RA中的微观语言特征。我们通过特征选择方法从英语期刊文章中提取25个高度相关的功能。所有论文都与Covid-19医学实证研究协议。然后通过监督机器学习方法在一致性和准确性方面验证所选功能。结果表明，24个语言特征，如相邻句子之间的内容词重叠，使用第三人称代词，辅助动词，时态，情绪词汇提供了对具有不同学术影响的期刊文章的一致和准确的预测。最后，随机森林模型被证明是适合这24个特征与期刊文章之间的关系的最佳模型，以及具有高和中等的冲击。这些调查结果可用于通知学术写作课程，并为L2研究生开发自动评估系统的基础。

translated by 谷歌翻译

Fed-EINI: An Efficient and Interpretable Inference Framework for Decision Tree Ensembles in Federated Learning

Xiaolin Chen , Shuai Zhou , Bei guan , Kai Yang , Hao Fan , Zejin Feng , Zhong Chen , Hu Wang , Yongji Wang

分类：机器学习 | 人工智能

2021-05-20

关于数据隐私和安全性的越来越多的担忧驱动了从孤立的数据源，即联合学习的隐私保留机学习的新兴领域。一类联合学习，\ Texit {垂直联合学习}，不同的各方对共同用户的不同特征，具有促进许多领域企业之间各种业务合作的潜力。在机器学习中，诸如梯度提升决策树（GBDT）和随机森林等决策树集合被广泛应用强大的型号，具有高的可解释性和建模效率。然而，最先进的垂直联合学习框架适应匿名功能以避免可能的数据泄露，使模型受到损害的可解释性。为了解决推理过程中的这个问题，在本文中，我们首先在垂直联合学习中对客场党的特征披露含义的必要性进行了问题分析。然后，我们发现树的预测结果可以表示为所有各方持有的树的子模型结果的交叉点。利用这种关键观察，我们通过隐藏决策路径来保护数据隐私并允许公开特征含义，并适应推理输出的通信有效的安全计算方法。通过理论分析和广泛的数值结果，将证明FED-EINI的优点。我们通过披露特征的含义来提高模型的可解释性，同时确保效率和准确性。

translated by 谷歌翻译